英伟达Rubin CPX发布,AI工厂愿景逐步清晰
在InfraAI全球峰会2025上,英伟达宣布推出即将发布的Vera Rubin数据中心AI产品家族的新成员。Rubin CPX将与标准的Rubin AI图形处理单元(GPU)互补,以更具成本效益的价格提供高价值的推理内容生成。更重要的是,它融入了英伟达为多A
在InfraAI全球峰会2025上,英伟达宣布推出即将发布的Vera Rubin数据中心AI产品家族的新成员。Rubin CPX将与标准的Rubin AI图形处理单元(GPU)互补,以更具成本效益的价格提供高价值的推理内容生成。更重要的是,它融入了英伟达为多A
CPX(Context Processing)是专门面向 AI Video、Coding 等大规模上下文处理任务的 Prefill 阶段 ASIC 芯片,核心价值在于 “增算减存”,能实质性降低 Prefill 阶段首 token 输出及 KV Cache 生
2025年9月,英伟达发布了专为AI推理和视频生成设计的Rubin CPX GPU,采用单片式设计和128GB GDDR7显存。然而,技术分析发现这款GPU可能隐藏着下一代游戏显卡的秘密。
Rubin CPX于2025年9月9日发布,是首款专为海量上下文AI处理(如百万token推理)设计的CUDA GPU。CPX算力达30PFLOPS (NVFP4精度),配备128GB GDDR7内存,能处理百万 tokens 量级的代码和生成式视频,猜测是应
英伟达推出的 Rubin CPX 面向“长上下文”人工智能应用,宣称可一次处理百万级别的 token,这对于整合大型代码仓库、小时级视频内容的生成与检索具有重要意义。行业专家对这款芯片的架构、系统化部署和潜在市场影响进行了解读,并指出企业在向超大上下文模型迁移
在周二的 AI 基础设施峰会上,英伟达宣布推出一款名为Rubin CPX(Rubin Context GPUs)的新 GPU,专为超过 100 万 token 的长上下文推理而设计。
在周二的 AI 基础设施峰会上,英伟达宣布推出一款名为Rubin CPX(Rubin Context GPUs)的新 GPU,专为超过 100 万 token 的长上下文推理而设计。
英伟达今日宣布推出新产品Rubin CPX,这是一款专为大规模上下文处理而设计的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。